max rank | avg. rank | sentence |
---|---|---|
146 | 64.4444 | Esta fue mi primera vez en la República Dominicana. |
226 | 79.5000 | Este año el dominicano lo ha hecho todo. |
234 | 59.3333 | No, no en el trabajo, en su vida personal. |
253 | 82.1667 | Distrito Nacional, Santo Domingo, República Dominicana. |
263 | 115.7143 | La familia es muy importante para él”. |
297 | 95.0588 | Otros - MercadoLibre República Dominicana MercadoLibre - Donde compras y vendes de todo Por ahora, no hay nada acá. |
307 | 126.3750 | Venta en Santo Domingo de Guzmán, Distrito Nacional. |
317 | 140.4286 | Es un partido muy importante para nosotros. |
317 | 133.3750 | No nosotros, sino lo que está entre nosotros. |
321 | 100.7000 | La sociedad dominicana de hoy no es la de antes. |
326 | 98.7500 | En nuestro país no es posible hacer empresa. |
333 | 165.0000 | Pero con ese poder usted puede hacer muchas cosas. |
335 | 123.7000 | No durante todo su Gobierno, sino más bien al final. |
350 | 80.1111 | El precio es importante, pero no lo es todo. |
364 | 143.7778 | Y como siempre, con la mejor relación calidad / precio. |
367 | 128.7000 | Lo que está en juego no podría ser más importante. |
369 | 135.0000 | “Este juego no se trata de un hombre”, dijo. |
379 | 125.2222 | No me puede decir que está fuera del poder. |
381 | 170.4286 | Danilo Medina, y con el pueblo dominicano”. |
389 | 162.2222 | En muy buen estado por dentro y por fuera. |
415 | 121.7143 | El problema está dentro de las personas. |
423 | 148.9231 | Sin embargo, esto es algo sobre lo que los usuarios no tienen control. |
430 | 127.7778 | Esta es una decisión muy personal de la familia. |
435 | 103.2500 | La cantidad de tiempo es tan importante como el tiempo de calidad. |
446 | 115.3000 | Pero, en realidad, el poder es mucho más que eso. |
446 | 104.7692 | Y es que en realidad, la sociedad es mucho más que un mercado. |
466 | 146.2222 | Por último, pero no menos importante, está el precio. |
475 | 174.8571 | El problema: Es el punto más importante. |
479 | 191.8750 | Pero ese es el tema del próximo artículo. |
497 | 131.7500 | Experiencia: en el con 4 años de experiencia. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II